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(54) Bezeichnung: Einrichtung und Verfahren zur Sprachsteuerung eines Gerats 



(57) Hauptanspruch: Einrichtung zur Sprachsteuerung ei- 
nes Gerats, mit Hilfe von den Betrieb des Gerats beeinflus- 
senden Befehlen, wobei auf einer Anzeigevorrichtung (9) in 
Abhangigkeit von einem jeweiligen Betriebszustand ein Teil 
der insgesamt vorgesehenen Befehle dargestellt wird, wo- 
bei eine Eingabe durch Aussprache jeweils eines der dar- 
gestellten Befehle erfolgt, gekennzeichnet durch einen 
Speicher (12) zur Speicherung von jeweils uber ein Mikro- 
fon (10) empfangenen Sprachsignalen oderdavon abgelei- 
teten Signalen, wobei die gespeicherten Signale nur mit 
den sprachrelevanten Signalen, welche den jeweils auf der 
Anzeigevorrichtung (9) dargestellten Befehlen entspre- 
chen, verglichen werden und wobei derjenige Befehl, bei 
welchem der Vergleich positiv ausfallt, als ausgewahlt an- 
genommen wird. 
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Beschreibung 

[0001] Die Erfindung betrifft eine Einrichtung und 
ein Verfahren zur Sprachsteuerung eines Gerats mit 
Hilfe von den Betrieb des Gerates beeinflussenden 
Befehlen. 

[0002] Zur Steuerung von Anlagen und Geraten 
werden in zunehmendem Made Spracheingaben 
verwendet, wobei uber ein Mikrofon aufgenommene 
Befehle des Benutzers mit Hilfe von Spracherken- 
nungsverfahren erkannt werden. Hierbei wird zwi- 
schen sprecherabhangigen und sprecherunabhangi- 
gen Spracherkennungsverfahren unterschieden, wo- 
bei die sprecherabhcingige Spracherkennung einen 
begrenzten, festen Befehlssatz aufweist, der durch 
den Benutzer trainiert werden muss. Dazu wird in ei- 
ner Lernphase jeder Befehl durch den Benutzer 
mehrmals wiederholt, damit sich die Spracherken- 
nungseinrichtung auf die Phonetik des Benutzers 
einstelien kann. 

[0003] Die sprecherunabhangige Spracherkennung 
arbeitet ebenfalls mit einem begrenzten, fest definier- 
ten Befehlssatz, wobei allerdings das Spracherken- 
nungsverfahren so "intelligent" ist, dass kein Training 
mehr erforderlich ist. 

[0004] Beiden Verfahren ist gemeinsam, dass nur 
ein begrenzter, fest vorgegebener Befehlsvorrat er- 
kannt werden kann. Diesen muss der Benutzer in der 
Regel auswendig lernen. Je grofcer die Anzahl der 
Befehle ist,, je hohere Anforderungen werden an das 
Spracherkennungsverfahren und an das Gedachtnis 
des Benutzers gestellt. 

[0005] Diese Nachteile der bekannten Spracher- 
kennungsverfahren erschweren die Sprachsteue- 
rung, beispielsweise eines Autoradios, besonders 
stark. Bei diesen Geraten ist namlich die Anzahl der 
erforderlichen Befehle relativ grofc, unter anderem 
durch die Vielzahl der Sender, auf die ein Autoradio, 
insbesordere wShrend einer langeren Fahrt, einzu- 
stellen ist. 

Stand der Technik 

[0006] Aus der DE 3636678 A1 ist eine Rontgendi- 
agnostikeinrichtung bekannt, die zur Steuerung eine 
Anzeige und eine Spracheingabe und -ausgabe auf- 
weist. In der Anzeige sind Buchstaben dargestellt, die 
bestimmte Befehle der Steuereinrichtung kennzeich- 
nen. Durch die Aussprache eines der Buchstaben 
wird ein entsprechender Befehl entweder simuliert 
Oder ausgefuhrt. 

Aufgabenstellung 

[0007] Aufgabe der vorliegenden Erfindung ist, eine 
Einrichtung und ein Verfahren zur Sprachsteuerung 
eines Gerats unter Vermeidung der obengenannten 
Nachteile vorzuschlagen, um insbesondere dem Be- 
nutzer ein Auswendiglernen vieler Befehle zu erspa- 
ren und eine Spracherkennung zu verbessern und zu 



beschleunigen. 

[0008] Diese Aufgabe wird erfindungsgemafi da- 
durch geldst, dass auf einer Anzeigevorrichtung in 
Abhangigkeit von einem jeweiligen Betriebszustand 
ein Teil der insgesamt vorgesehenen Befehle darge- 
stellt wird, wobei eine Eingabe durch Aussprache je- 
weils eines der dargestellten Befehle erfolgt, dass ein 
Speicher zur Speicherung von jeweils uber ein Mikro- 
fon empfangenen Sprachsignalen oder davon abge- 
leiteten Signalen vorgesehen ist, wobei die gespei- 
cherten Signale nur mit den sprachrelevanten Signa- 
len, welche den jeweils in der Anzeigevorrichtung 
dargestellten Befehlen entsprechen, verglichen wer- 
den und dass derjenige Befehl, bei welchem der Ver- 
gleich positiv ausfallt, als ausgewahlt angenommen 
wird. 

[0009] Die erfindungsgemafce Einrichtung und das 
erfindungsgema&e Verfahren haben einerseits den 
Vorteil, daft dem Benutzer angezeigt wird, welche 
Befehle bei dem jeweils vorhandenen Betriebszu- 
stand der Anlage und des Gerates eingegeben wer- 
den konnen. Dabei ist nicht nur die Auswahl als sol- 
che von Vorteil, sondern auch die Sichtbarmachung 
der einzelnen Befehle, wodurch der Benutzer gehal- 
ten wird, die vorgegebenen Worter zu verwenden. So 
wird beispielsweise die versehentliche Benutzung ei- 
nes fur das Spracherkennungssystem nicht erkenn- 
baren Synonyms durch den Benutzer vermieden. An- 
dererseits haben die erfindungsgemafie Einrichtung 
und das erfindungsgemafce Verfahren den Vorteil, 
daU die Spracherkennungseinrichtung die empfan- 
genen Sprachsignale trotz einer grofien Anzahl von 
insgesamt moglichen Befehlen nur mit jeweils weni- 
gen im Menu dargestellten Befehlen vergleichen 
mu&. Dadurch kann ein einfaches und sicheres Spra- 
cherkennungsverfahren gewahlt werden. 
[0010] Eine Weiterbildung der erfindungsgemafien 
Einrichtung und des erfindungsgemalien Verfahrens 
besteht darin, dafc die sprachrelevanten Signale 
durch Sprachsynthese der jeweils dargestellten Be- 
fehle erzeugt und in einem weiteren Speicher abge- 
legt werden. Dieses hat den Vorteil, daft der Herstel- 
ler der Anlagen und Gerate und gegebenenfalls auch 
der Benutzer bei Anderungen der Befehlsauswahllis- 
ten (Mentis) bzw. der einzelnen Befehle neue Befehle 
lediglich in Form von Text, beispielsweise sogenann- 
ten ASCII-Zeichen, eingeben kann, die dann in diezu 
vergleichenden sprachrelevanten Signale umgewan- 
delt werden. 

[0011] Bei der erfindungsgemafien Einrichtung und 
dem erfindungsgemalien Verfahren kann ferner vor- 
gesehen sein, dafl der Speicher und der weitere 
Speicher Analogspeicher sind und dad der Vergleich 
mit Analogsignalen erfolgt oder dafc der Speicher und 
der weitere Speicher digitale Speicher sind und dafc 
der Vergleich mit digitalen Signalen erfolgt. 
[0012] Je nach Voraussetzungen im einzelnen kann 
auch eine Ausfuhrungsform vorteilhafter sein, die da- 
rin besteht, daft die zu vergleichenden sprachrele- 
vanten Signale aller insgesamt vorgesehenen Befeh- 
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le in einem Speicher abgelegt sind und dafc der Zu- 
griff auf den Speicher zu Zwecken des Vergleichs 
entsprechend den jeweils dargestellten Befehlen ge- 
steuert wird. 

[0013] Eine weitere vorteilhafte Ausgestaltung der 
erfindungsgemafien Einrichtung besteht darin, dali 
die sprachrelevanten Signale die Grundmodulation 
beim Sprechen des jeweiligen Befehls darstellen. 
Hierdurch ist ein einfacher Vergleich der gespeicher- 
ten mit den sprachrelevanten Signalen moglich. 

Ausfuhrungsbeispiel 

[0014] Ein Ausfuhrungsbeispiel der Erfindung ist in 
der Zeichnung dargestellt und in der nachfolgenden 
Beschreibung nSher erlautert. 
[0015] Bei dem dargestellten Ausfuhrungsbeispiel 
wird mit einer erfindungsgemafcen Einrichtung ein 
Autoradio sprachgesteuert, das schematisch durch 
einen Empfangsteil 1 mit einer Antenne 2, einen Sig- 
nalverarbeitungsteil 3, zwei Endstufen 4, 5 und Laut- 
sprecher 6, 7 dargestellt ist. Der Signalverarbeitungs- 
teil 3 kann in an sich bekannter Weise beispielsweise 
einen Stereodecoder, einen Radio-Datensignal-De- 
coder, einen Verkehrsfunkdecoder sowie Lautstarke- 
und Klangsteller enthalten. 

[0016] Das Empfangsteil 1 und das Signalverarbei- 
tungsteil 3 werden von einem Mikrocomputer 8 ge- 
steuert, der von dem Signalverarbeitungsteil 3 auch 
verschiedene Daten, wie beispielsweise decodierte 
Radio-Datensignale erhalt. Ein Ausgang des Mikro- 
computers 8 ist mit einer Anzeigevorrichtung (Dis- 
play) 9 verbunden, die ein Menu mit, den im jeweili- 
gen Betriebszustand des Autoradios ausfuhrbaren 
Befehlen zeigt. Dieses kann beispielsweise eine Lis- 
te von Einstellungen wie "Kassette", "UKW\ "Mittel- 
welle", "Verkehrsfunk" oder eine Auswahl der jweils 
zu empfangenden Sender sein. Bei bekannten Ein- 
gabeeinrichtungen, die nicht sprachgesteuert sind, 
wird die Einstellung eines der Sender durch einen 
Druck auf eine Taste, die neben dem Namen des 
Senders angeordnet ist, bewirkt. 
[0017] Bei der erfindungsgemaften Einrichtung zur 
Sprachsteuerung ist ein Mikrofon 10 vorgesehen, 
dessen Ausgangssignale uber einen Verstarker 11 
einem Speicher 12 zugefuhrt werden. Aufcer der An- 
zeigevorrichtung 9 ist an dem Mikrocomputer 8 ein 
Sprachcodierer 13 angeschlossen, dessen Aus- 
gangssignale synthetische Sprachsignale darstellen 
und in einen Speicher 14 einschreibbar sind. Verfah- 
ren zur Sprachcodierung sind an sich bekannt, bei- 
spielsweise durch das Computerprogramm SAY fur 
den Computer Amiga. Die Inhalte der Speicher 12 
und des Speichers 14 kdnnen in einer Vergleichsein- 
richtung 15 verglichen werden. Stimmt eines der im 
Sprachcodierer 13 erzeugten Signale mit dem im 
Speicher 12 vorhandenen Signal uberein - ein- 
schliefclich eines Toleranzbereichs - wird dem Mikro- 
computer 8 gemeldet, welches der sprachrelevanten 
Signale, das heifct, welcher Befehl aus dem darge- 



stellten Menu, mit dem eingegebenen Befehl uber- 
einstimmt. Die entsprechende Funktion wird dann 
vom Mikrocomputer 8 ausgefuhrt. 
[001 8] Danach kann dann gegebenenfalls ein ande- 
res Menu mit Hilfe der Anzeigevorrichtung 9 sichtbar 
gemacht werden, wobei die im Menu aufgefiihrten 
Daten dem Sprachcodierer 13 zugefuhrt werden, wo- 
rauf eine neue Spracheingabe moglich ist. 

Patentanspruche 

1. Einrichtung zur Sprachsteuerung eines Ge- 
rats, mit Hilfe von den Betrieb des Gerats beeinflus- 
senden Befehlen, wobei auf einer Anzeigevorrich- 
tung (9) in AbhSngigkeit von einem jeweiligen Be- 
triebszustand ein Teil der insgesamt vorgesehenen 
Befehle dargestellt wird, wobei eine Eingabe durch 
Aussprache jeweils eines der dargestellten Befehle 
erfolgt, gekennzeichnet durch einen Speicher (12) 
zur Speicherung von jeweils uber ein Mikrofon (10) 
empfangenen Sprachsignalen oder davon abgeleite- 
ten Signalen, wobei die gespeicherten Signale nur 
mit den sprachrelevanten Signalen, welche den je- 
weils auf der Anzeigevorrichtung (9) dargestellten 
Befehlen entsprechen, verglichen werden und wobei 
derjenige Befehl, bei welchem der Vergleich positiv 
ausfallt, als ausgewahlt angenommen wird. 

2. Einrichtung nach Anspruch 1, dadurch ge- 
kennzeichnet, dass die sprachrelevanten Signale 
durch Sprachsynthese der jeweils dargestellten Be- 
fehle erzeugt und in einem weiteren Speicher (14) 
abgelegt werden. 

3. Einrichtung nach Anspruch 2, dadurch ge- 
kennzeichnet, dass der Speicher (12) und der weitere 
Speicher (14) Analogspeicher sind und dass der Ver- 
gleich mit Analogsignalen erfolgt. 

4. Einrichtung nach Anspruch 2, dadurch ge- 
kennzeichnet, dass der Speicher (1 2) und der weitere 
Speicher (14) digitale Speicher sind und dass der 
Vergleich mit digitalen Signalen erfolgt. 

5. Einrichtung nach Anspruch 1, dadurch ge- 
kennzeichnet, dass die zu vergleichenden sprachre- 
levanten Signale aller insgesamt vorgesehenen Be- 
fehle in einem. Speicher abgelegt sind und dass der 
Zugriff auf den Speicher zu Zwecken des Vergleichs 
entsprechend den jeweils dargestellten Befehlen ge- 
steuert wird. 

6. Einrichtung nach einem der Anspruche 1 bis 5, 
dadurch gekennzeichnet, dass die sprachrelevanten 
Signale die Grundmodulation beim Sprechen des je- 
weiligen Befehls darstellen. 

7. Verfahren zur Sprachsteuerung eines Gerats 
mit Hilfe von den Betrieb des GerSts beeinflussenden 
Befehlen, wobei auf einer Anzeigevorrichtung in Ab- 
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hangigkeit von einem jeweiligen Betriebszustand ein 
Teil der insgesamt vorgesehenen Befehlen darge- 
stellt wird, wobei eine Eingabe durch Aussprache je- 
weils eines der dargestellten Befehle erfolgt, dadurch 
gekennzeichnet, dass in einem Speicher uber ein Mi- 
krofon empfangene Sprachsignale oder davon abge- 
leitete Signale gespeichert werden, dass die gespei- 
cherten Signale nur mit den sprachrelevanten Signa- 
len, welche den jeweils in der Anzeigevorrichtung 
dargestellten Befehlen entsprechen, verglichen wer- 
den und dass derjenige Befehl, bei welchem der Ver- 
gleich positiv ausfailt, als ausgewahlt angenommen 
wird. 

8. Verfahren nach Anspruch 7, dadurch gekenn- 
zeichnet, dass die sprachrelevanten Signale durch 
Sprachsynthese der jeweils dargestellten Befehle er- 
zeugt und in einem weiteren Speicher, abgelegt wer- 
den. 

9. Verfahren nach Anspruch 8, dadurch gekenn- 
zeichnet, dass der Speicher und der weitere Speicher 
Analogspeicher sind und dass der Vergleich mit Ana- 
logsignalen durchgefuhrt wird. 

1 0. Verfahren nach Anspruch 8, dadurch gekenn- 
zeichnet, dass der Speicher und der weitere Speicher 
digitale Speicher sind und dass der Vergleich mit di- 
gitalen Signalen durchgefuhrt wird. 

11 . Verfahren nach Anspruch 7, dadurch gekenn- 
zeichnet, dass die zu vergleichenden sprachrelevan- 
ten Signale aller insgesamt vorgesehenen Befehle in 
einem Speicher abgelegt sind und dass der Zugriff 
auf den Speicher zu Zwecken des Vergleichs ent- 
sprechend den jeweils dargestellten Befehlen ge- 
steuert wird. 

Es folgt ein Blatt Zeichnungen 



4/5 



DE 44 27 444 B4 2004.07.29 
Anhangende Zeichnungen 



/IV 



/ 









to .41 



> 




5/5 



